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Beschreibung 

Die Erfindung betrifft ein Verfahren zur Spracher- 
kennung an Endgeraten von Fernmelde-, insbesondere 
Fernsprechanlagen nach dem Oberbegriff des Patentan- 
spruches 1. 

Aus der DE-OS 29 41 928 ist eine Schaltungsanord- 
nung fur eine Fernsprechteilnehmerstation bekannt, die 
eine Spracherkennungs- und Auswerteschaltung ent- 
halt, womit gesprochene Worte erkannt werden kon- 
nen. Bei den gesprochenen Worten handelt es sich aus- 
schlieBlich um gesprochene Ziffern, die iiber das Mikro- 
fon als Wahlinformation eingegeben werden. Jede ein- 
zelne gesprochene Ziffer wird dann nach eindeutiger 
Erkennung nach dem auf der AnschluBleitung gultigen 
Wahlverfahren als parallele oder serielle Einzelinforma- 
tion abgegeben. Weil es sich dabei lediglich um die 
Wahlinformation handelt genugt es, die Lautbilder von 
maximal zehn Ziffern und je nach Ausfuhrungsart von 
einigen wenigen Zusatzbefehlen als Referenzmuster in 
Speichern abzulegen. Der Speicheraufwand steigt be- 
trachtlich, wenn weitere Befehle mit moglicherweise 
langeren Wortkombinationen erkannt werden sollen. 
AuBerdem ist ein erhShter Speicheraufwand erforder- 
lich, wenn personenbezogene Lautbilder eingespeichert 
werden, so daB die betreffenden Befehle nur dann aus- 
gefuhrt werden, wenn die Eingabe von einem bestimm- 
ten Sprecher aus abgegeben wird. Um eine einwand- 
freie Funktion zu gewahrleisten, muB die gerate-indiyi- 
duelle Auswerteeinrichtung so beschaffen sein, daB je- 
der einzelne sprachlich eingegebene Befehl eindeutig 
erkannt werden kana Der dazu notwendige Prozessor 
muB deshalb sehr aufwendig sein, damit keine Fehlinter- 
pretationen auf treten. 

Ein Verfahren zur Ubermittlung von besonderen Auf- 
tragen in Fernsprechvermittlungsanlagen, insbesondere 
Fernsprech-Nebenstellenanlagen, ist aus der CH-PS 
6 44 482 bekannt Hierbei handelt es sich um eine zen- 
tral in der Vermittlungsstelle angeordnete Spracherken- 
nungseinrichtung, die einem Teilnehmer zur Verfugung 
gestellt wird, wenn eine besondere Steuerinformation 
abgegeben wird. Danach besteht die Moglichkeit, vor- 
bestimmte Befehlsworte einzusprechen, um besondere 
Auftrage an das Vermittlungssystem zu geben, damit 
eines oder mehrere gewunschte Merkmale wirksam 
werden. Bei einem vorgegebenen Grad der Uberein- 
stimmung des eingesprochenen Befehlswortes mit ei- 
nem abgespeicherten Referenzmuster kann das erkann- 
te Wort von einer Sprachausgabeeinrichtung als Quit- 
tung zum Teilnehmer gesendet werden. Da diese Ein- 
richtung vielen Teilnehmern zur Verfugung stehen soil, 
muB entweder eine sprecherunabhangige Spracherken- 
nung vorgesehen sein, oder es ist ein sehr umfangreiches 
Speichervolumen fur teilnehmerindividuelle Speicher- 
einrichtungen erforderlich. AuBerdem konnen nicht be- 
liebig viele Spracherkenner vorhanden sein, so daB Eng- 
passe entstehen wenn Befehlsworte nicht sofort richtig 
erkannt werden. 

Auch in einem Aufsatz mit dem Titel: "Spracherken- 
nung und Sprachsynthese fur Dienste von Nebenstel- 
lenanlagen", der abgedruckt ist in der DE-Zeitschrift 
"Elektrisches Nachrichtenwesen", Band 59, Nr. 3, 1985, 
ab Seite 273, werden zentral angeordnete Spracherken- 
nungseinrichtungen beschrieben. Es ist im einzelnen 
aufgezeigt, welche in einer Nebenstellenanlage iiblichen 
Merkmale mittels Spracheingabe gesteuert werden 
konnen, und wie dabei zu verfahren ist Derart umfang- 
reiche Moglichkeiten erfordern einen relativ groBen 
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Steuer- und Speicheraufwand, und je nach Teilnehmer- 
verhalten treten grdBere Belegungszeiten auf, wenn Be- 
fehle wiederholt werden mussen. Dies kann zu Engpas- 
sen fuhren, wenn nicht genugend zentrale Spracherken- 
5 ner zur Verfugung stehen. Es konnen Besetzfalle und 
Wartezeiten entstehen, so daB die zentralen Einrichtun- 
gen nicht immer sofort verf tigbar sind. 

Ein "sprachgesteuertes Telefon mit elektronischem 
Telefonregisterspeicher" ist in der DE-Zeitschrift ntz, 

10 Band 37, (1984, Heft 8, ab Seite 496) beschrieben. Es 
handelt sich dabei um eine Spracherkennungseinheit, 
die einem Fernsprech-Endgerat direkt zugeordnet ist 
Damit sollen sprachlich eingegebene Befehlsworte und 
insbesondere Wahlziffern erkannt werden, so daB eine 

15 Vereinfachung der Bedienung erreicht wird. Als Vorteil 
wird dabei herausgestellt daB fur eine sprachgesteuerte 
Wahl individuelle Teilnehmernamen eingebbar sind. 
Davon werden auf sprecherabhangiger Basis benutzer- 
spezifische Referenzmuster erzeugt Bei einem groBe- 

20 ren Benutzerkreis tritt ein hoher Speicherbedarf auf, so 
daB die Referenzmuster-Daten in zusatzlichen Spei- 
chern ausgelagert werden mQssen. AuBerdem wird an- 
geftihrt, daB der Wortschatz in Grenzen gehalten wer- 
den sollte, weil sonst mit einer erhohten Verwechslungs- 

25 gefahr und mit groBeren Reaktionszeiten zu rechnen ist 
Da eine solche Spracherkennungseinrichtung nur fur 
ein Endgerat vorgesehen ist ergeben alle Mehraufwen- 
dungen, die fur einen groBeren Wortschaft in Form von 
Speicherkapazitat und fur eine hohe Erkennungsgenau- 

30 igkeit in Form von Rechenleistung aufzubringen sind, 
direkt moglicherweise zu hohe Kosten fur ein derartiges 
Gerat 

Die Aufgabe der Erfindung besteht darin, ein Verfah- 
ren zur Spracherkennung an Endgeraten von Fernmel- 

35 de-, insbesondere Fernsprechanlagen anzugeben, wobei 
der im Endgerat selbst notwendige Speicher- und Steu- 
eraufwand auch dann in Grenzen gehalten wird, wenn 
eine Vielzahl von Befehlen und Variationen der Eingabe 
moglich sein solL 

40 Diese Aufgabe wird mit Merkmalen gelost wie sie im 
Patentanspruch 1 angegeben sind. 

Damit wird in vorteilhafter Weise erreicht daB die 
Sicherheit bei der Spracherkennung auch dann nicht 
vermindert wird, wenn die Anzahl und Variation von 

45 Sprachdaten vergroBert wird, ohne daB dabei die im 
Endgerat vorzusehenden Speicher- und Steuereinrich- 
tungen allzu aufwendig werden mussen. Weiterbildun- 
gen der Erfindung ergeben sich aus den Unteransprfl- 
chen. 

so Ein Ausfuhrungsbeispiel der Erfindung-wird nachfol- 
gend anhand einer Zeichnung naher erlautert Von den 
in einem Endgerat EG vorhandenen Einrichtungen sind 
nur diejenigen in Form eines Blockschaltbildes darge- 
stellt die mit der Erfindung unmittelbar im Zusammen- 

55 hang stehen. Die von einem Mikrofon M aufgenomme- 
nen Befehle werden parallel einer Spracherkennungs- 
einrichtung SPE und einem Sprachzwischenspeicher 
SZSP zugefuhrt. Da es sich um digitale Speichermedien 
handelt werden die analogen Sprachsignale in nicht 

60 dargestellter Weise analog/digital-gewandelt Dabei 
werden bekannte Codierungsverfahren zugrunde ge- 
legt Die Spracherkennungseinrichtung SPE vergleicht 
nun die angebotenen Sprachsignale mit innerhalb der 
Spracherkennungseinrichtung SPE abgelegten Refe- 

65 renzmustern, so daB festgestellt werden kann, welcher 
Schaltbefehl vom Benutzer des Gerates eingegeben 
wurde. Die in der Spracherkennungseinrichtung SPE 
vorhandenen Vergleicher weisen verschiedene Schwel- 



DE 35 19 915 Ci 



len auf, womit eine Aussage daruber abgegeben wird, 
ob eine Erkennung eindeutig, unsicher oder fehlerhaft 
ist. 

Wird die Bedeutung eines Wortes oder einer Wortfol- 
ge eindeutig erkannt, weil sie mit einem vorgegebenen 5 
Referenzmuster ziemlich vollkommen ubereinstimmt, 
so erscheint ein Signal S 1, das die sofortige Ausfuhrung 
des betreffenden Befehls zur Folge hat und auBerdem 
einer Anzeigeeinrichtung M£"zugefuhrt wird. Selbstver- 
standlich ist es auch denkbar, die Ausfuhrung des Befeh- io 
les von einem weiteren Befehl abhangig zu machen, 
wenn der Benutzer erkannt hat, daB die Spracherken- 
nungseinrichtung SPE die gewunschte Funktion richtig 
erkannt hat, falls fur besondere Betriebsfalle eine erhoh- 
te Sicherheit verlangt wird. , 5 

Falls die Vergleichseinrichtungen der Spracherken- 
nungseinrichtung SPE keine eindeutige Ubereinstim- 
mung zwischen einem eingegebenen Sprachsignal und 
den abgelegten Referenzmustern feststellen konnen, so 
wird ein besonderes Signal S2 abgegeben. Dieses Si- 20 
gnal gelangt in eine Steuereinrichtung SE, wodurch die 
AnschluBleitung AL belegt wird. Es wird ein Schaltmit- 
tel K2 geschlossen, wodurch der Sprachzwischenspei- 
cher SZSP mit der AnschluBleitung AL verbunden wird. 
Von der Spracherkennungseinrichtung SPE aus wird 25 
veranlaBt, daB die im Sprachzwischenspeicher SZSP 
eingespeicherte Information ausgelesen wird. Die im 
Sprachzwischenspeicher SZSP abgelegte Sprachinfor- 
mation gelangt je nach Betriebsart der AnschluBleitung 
AL entweder direkt digital zur Fernsprechanlage FA, 30 
oder sie wird bei analoger AnschluBleitung AL zuvor 
analog gewandelt Bei digitaler AnschluBleitung AL 
wird diese Information in einem sogenannten B-Kanal 
als Nutzinformation ubertragen. Wenn ein Endgerat an 
das digitale Fernmeldenetz zur integrierten Obertra- 35 
gung mehrerer Dienste (ISDN) angeschlossen ist und 
dabei zwei sogenannte S-Kanale zur Verfugung stehen, 
kann die Obertragungszeit auf die Halfte reduziert wer- 
den, indem beide B-Kanale benutzt werden. 

In der Fernsprechanlage FA befindet sich eine zentral 40 
angeordnete Spracherkennungseinrichtung mit erhoh- 
ter Speicher- und Rechenkapazitat Die Ober die An- 
schluBleitung AL eingegebene Sprachinformation kann 
dann mit wesentlich mehr Referenzmustern verglichen 
werden, so daB mit einer erhohten Wahrscheinlichkeit 45 
der gewunschte Befehl eindeutig identifiziert werden 
kann. Die von der zentralen Spracherkennungseinrich- 
tung daraufhin gewonnene Erkenntnis wird uber die 
AnschluBleitung AL zuriick zum Endgerat EG ubertra- 
gen. Bei digitaler AnschluBleitung AL bietet sich hierfur 50 
der Signalisierungskanal D an. Die von der Fernsprech- 
anlage FA kommende Information gelangt in die 
Steuereinrichtung SE des Endgerates EG, wobei dann 
die Anzeigeeinrichtung AE angesteuert wird Handelt 
es sich um einen Befehl, der innerhalb der Fernsprech- 55 
anlage FA auszufuhren ist, so kann dies unmittelbar 
geschehen, indem die dortige zentrale Steuerung ange- 
reizt wird. Bei innerhalb des Endgerates EG auszufilh- 
renden Befehlen, wird die Steuereinrichtung SE des 
Endgerates EG tatig. 60 

Naturlich ist es auch denkbar, daB selbst die zentrale 
Spracherkennungseinrichtung einen Befehl nicht ein- 
deutig erkennen kann. Es wird dann auf die zuvor be- 
schnebene Weise eine Fehlermeldung uber die An- 
schluBleitung AL zum Endgerat EG Ubertragen. Die 6 s 
Steuereinrichtung SSnimmt diesen Befehl auf und steu- 
ert die Anzeigeeinrichtung AEin entsprechender Weise 
an. Der Benutzer erkennt dann an der Anzeige, daB die 



von ihm eingegebene Sprache nicht richtig erkannt 
worden ist. 

Es ist auBerdem vorgesehen, daB bei Spracheingaben, 
die sehr weit abweichen von den vorgesehenen Refe- 
renzmustern von der Spracherkennungseinrichtung 
SPEdes Endgerates EG, direkt ein Fehlersignal Fabge- 
geben wird. Dieses Signal gelangt direkt zur Anzeige- 
einrichtung AE, ohne daB eine Funktion bewirkt wird, 
und ohne daB Sprachinformationen uber die AnschluB- 
leitung AL zur Fernsprechanlage und zur dortigen zen- 
tralen Spracherkennungseinrichtung ubertragen wer- 
den. 

Um den Datenaustausch zwischen dem Endgerat EG 
und der zentralen Spracherkennungseinrichtung in der 
Fernsprechanlage FA zu vereinfachen, und die dafur 
benotigte Zeit zu verkiirzen, kann im Endgerat EG eine 
Sprachvorverarbeitungseinrichtung SPV vorgesehen 
sein. Dann werden die im Sprachzwischenspeicher 
SZSP befindlichen Sprachinformationen von der 
Sprachvorverarbeitungseinrichtung SPVso aufbereitet 
daB die uber die AnschluBleitung AL zu ubertragende' 
Information direkt geeignet ist, die in der Fernsprechan- 
lage FA angeordnete Spracherkennungseinrichtung. 
bzw. deren Speicher gezielt anzusteuern. Wenn das 
Endgerat EG mit einer Sprachvorverarbeitungseinrich- 
tung SPV ausgestattet ist so wird von der Steuerein- 
richtung SE anstelle des Schaltmittels K2 das Schalt- 
mittel K 1 betatigt, so daB der Ausgang der Sprachvor- 
verarbeitungseinrichtung SPV mit der AnschluBleitung 
AL verbunden ist 

Wenn der Benutzer an der Anzeigeeinrichtung AE 
erkennt, daB eine Fehlermeldung F erscheint, so kann 
durch Eingabe in deutlicherer Form der Befehl wieder- 
holt werden. Bei der Anzeige ist auBerdem denkbar, daB 
zusatzlich eine Information erscheint, wenn die in der 
Fernsprechanlage FA befindliche zentrale Spracher- 
kennungseinrichtung in Anspruch genommen wurde. 
Der Benutzer wird dann veranlaBt, sich eine prazise 
Abgabe der Sprachinformation anzugewdhnen. 

Patentanspriiche 

1. Verfahren zur Spracherkennung an Endgeraten 
von Fernmelde-, insbesondere Fernsprechanlagen, 
wobei innerhalb des Endgerates eine Spracherken- 
nungseinrichtung (Spracherkenner) angeordnet ist, 
die Sprachsignale vom Mikrophon aufnimmt und 
daraus Befehle zur Steuerung von Merkmalen oder 
fur den Aufbau von Verbindungen bildet, indem ein 
Vergleich durchgefuhrt wird zwischen als Refe- 
renzmuster abgespeicherten Befehlsworten und 
dem von der jeweiligen Spracheingabe erzeugten 
Referenzmuster, und wobei das Endgerat an eine 
Vermittlungsanlage angeschlossen ist, die eine zen- 
tral angeordnete Spracherkennungseinrichtung 
aufweist, dadurch gekennzeich.net, 
daB im Endgerat (EG) ein besonderer Sprachzwi- 
schenspeicher (SZSP) vorgesehen ist, der die dem 
Spracherkenner (SPE) angebotenen Sprachsignale 
zusatzlich aufnimmt, 

daB die zentrale, in der Fernmelde- oder Fern- 
sprechanlage (FA) angeordnete Sprackerken- 
nungseinrichtung mit erhohter Speicher- und Re- 
chenkapazitat automatisch angesteuert wird, und 
die im Sprachzwischenspeicher (SZSP) befindliche 
Information dorthin ubertragen wird, wenn im 
Endgerat (EG) befindliche Spracherkennungsein- 
richtung (SPE) eine Spracheingabe nicht eindeutig 
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erkennen und einem der abgespeicherten Refe- 
renzmuster zuordnen kann. 

2 Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB die zur zentralen Spracherkennungs- 
einrichtung zu sendenden Sprachsignale in analo- 5 
ger Form Obertragen werden. 
3. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB die zur zentralen Spracherkennungs- 
einrichtung zu sendenden Sprachsignale in digitaler 
Form (z. B. PCM) ubertragen werdea io 
4 Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB dem Sprachzwischenspeicher (SZSP) 
eine Sprachvorverarbeitungseinrichtung (SPV) 
nachgeschaltet ist, und der zentralen Spracherken- 
nungseinrichtung anstelle von direkten Sprachsi- is 
gnalen analysierte Ansteuerdaten zugefuhrt wer- 

5 6 Verfahren nach Anspruch 4, dadurch gekenn- 
zeichnet, daB die Analyse der Spracheingabe durch 
die Sprachvorverarbeitung (SPV) zur gleichen Zeit 20 
vorgenommen wird, zu der die Spracherkennungs- 
einrichtung (SP£,Jarbeitet. 

6 Verfahren nach Anspruch 1, dadurch pkenn- 
zeichnet, daB die von der im Endgerat (EG) > befind- 
lichen Spracherkennungseinrichtung (SPE) Oder 25 
von der zentralen Spracherkennungseinrichtung 
erarbeitete Information zur Kontrolle einer Anzei- 
geeinrichtungCAE; zugefuhrt wird. 
7. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB beim Vergleicher in der im Endgerat 30 
(EG) befindlichen Spracherkennungseinrichtung 
(SPE) zwei Ansprechschwellen vorgesehen smd, 
wobei die erste Schwelle (SVS2) unterscheidet 
zwischen einer sicheren und einer unsicheren Er- 
kennung von Spracheingaben und eine zweite 35 
Schwelle (S2/F) zwischen einer unsicheren Erken- 
nung und einer fehlerhaften Eingabe entscheidet 
8 Verfahren nach Anspruch 7, dadurch gekenn- 
zeichnet, daB ein Unterschreiten der zweiten 
Schwelle (S2) als fehlerhafte Spracheingabe inter- 40 
pretiert wird, wobei ein Fehlersignal (F) erzeugt 
wird welches ohne eine Funktion zu bewirken le- 
diglich in der Anzeigeeinrichtung erscheint, wobei 
dann eine Ansteuerung der zentral angeordneten 
Spracherkennungseinrichtung unterbleibt. 45 
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